Поиск в словарях
Искать во всех

Социологическая энциклопедия - анализ многомерный статистический

 
 

Связанные словари

Анализ многомерный статистический

анализ многомерный статистический
раздел математической статистики , предназначенный для анализа связей между тремя и более переменными. Можно условно выделить три основных класса задач А.М.С. Это исследование структуры связей между переменными и снижение размерности пространства признаков, построение классификаций и типологий, исследование причинных связей.

Для представления структуры связей между переменными обычно используется матрица корреляций  . Ее анализ, заключающийся в выделении подмножеств переменных, тесно коррелирующих друг с другом, может осуществляться "вручную", например, с помощью графа, отражающего наиболее существенные связи между переменными, либо методами компьютерного анализа, такими, как метод главных компонент,  факторный анализ,  кластерный анализ  переменных. Анализ структуры связей часто рассматривается в качестве самостоятельной задачи, например, при исследовании структуры ценностей, мотивов и т.п., для проверки психометрических шкал на надежность и в других случаях. Однако он может использоваться и в качестве промежуточного этапа при решении задачи снижения размерности пространства признаков.

Снижение размерности обычно применяется для построения пространства, более удобного для решения задач классификации и исследования причинных связей, чем исходный набор переменных. Задача снижения размерности заключается в том, чтобы от большого количества исходных переменных перейти к нескольким обобщенным показателям. Метод главных компонент , анализ факторный  , метод многомерного шкалирования  предусматривают для этого разнообразные процедуры.

Задачи и методы классификации,  в зависимости от условий, делятся на три группы: классификация по заданным формальным критериям, автоматическая классификация и классификация с обучением. Классификация по заданным критериям, строго говоря, не является статистическим методом. Она состоит в группировке объектов по одному или нескольким показателям. В последнем случае классификация называется перекрестной или лингвистической (например, половозрастная структура населения).

Автоматическую классификацию применяют в тех случаях, когда критерии группировки неизвестны и отсутствуют априорные представления о количестве и характере классов. Для ее построения используются методы анализа кластерного , позволяющие выделить группы объектов, близких друг к другу по значениям измеренных переменных. В основе кластерного анализа лежит вычисление расстояний между объектами.

Классификация с обучением применяется, когда критерии классификации неизвестны, но известно количество классов и их типологические особенности. В этом случае может быть сформирована так называемая выборка обучающая  , состоящая из реальных объектов, обладающих соответствующими характеристиками, или/и искусственных объектов моделей "типичных представителей" классов. В обучающей выборке должны присутствовать "представители" всех предполагаемых классов. Классификация конкретного объекта состоит в том, что вычисляется расстояние между ним и объектами из обучающей выборки и объект причисляется к тому классу, расстояние до которого для него оказалось минимальным. Классификация с обучением осуществляется некоторыми методами кластерного и дискриминантного анализа.

Анализу статистических причинных связей в последние годы уделяется особое внимание. Классическим методом для решения таких задач является дисперсионный анализ,  в основе которого лежит эксперимент факторный   (не путать с анализом факторным ). Начиная с 1960-х активно разрабатываются регрессионные и регрессионно-подобные причинные модели ( Каузальное моделирование), а также техники, позволяющие использовать в этих моделях не только "количественные", но и "качественные" переменные ( Dummy-кодирование). В настоящее время для исследования причинных связей, в зависимости от характера используемых переменных, применяются методы множественной линейной регрессии, логистической регрессии, дискриминантного анализа и т.п. Эти методы предполагают наличие единственной зависимой переменной и не позволяют исследовать структуру связей между независимыми переменными (предикторами). Структура связей между предикторами может быть учтена в моделях анализа путевого .

Наиболее общим является метод линейных структурных уравнений , позволяющий строить сложные модели с большим числом взаимодействующих между собой зависимых и независимых переменных, среди которых могут быть не только наблюдаемые, но и латентные признаки. Регрессионный, дисперсионный, путевой и факторный анализ являются его частными случаями.

О.В. Терещенко

Рейтинг статьи:
Комментарии:

См. в других словарях

1.
  раздел статистики математической (см.), посвященный математич. методам, направленным на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака (см.) и предназначенным для получения научн. и практич. выводов. Исходным массивом многомерных данных для проведения А.м.с. обычно служат рез-ты измерения рассматриваемых признаков (компонент многомерного признака) на каждом из объектов исследуемой совокупности, т. е. последовательность многомерных наблюдений. Значительная часть А.м.с. обслуживает ситуации, в к-рых исследуемый многомерный признак интерпретируется как многомерная случайная величина  и соответственно последовательность многомерных наблюдений как выборка из генеральной совокупности. В этом случае выбор методов обработки исходных статистич. данных и анализ их свойств производится на основе тех или иных допущений относительно природы многомерного (совместного) закона распределения вероятностей изучаемого многомерного признака (см. Распределение вероятностей, Закон распределения). По содержанию А.м.с. может быть условно разбит на три основных подраздела:...
Российская социологическая энциклопедия

Вопрос-ответ:

Ссылка для сайта или блога:
Ссылка для форума (bb-код):